LucKy_one

Always aiming higher


  • 首页

  • 关于

  • 标签

  • 分类

  • 归档

  • 搜索

加权随机算法

发表于 2015-03-31 更新于 2015-06-26
介绍几种常用的加权随机算法以及各自的优缺点

加权随机算法一般应用在以下场景:有一个集合S,里面比如有A,B,C,D这四项。这时我们想随机从中抽取一项,但是抽取的概率不同,比如我们希望抽到A的概率是50%,抽到B和C的概率是20%,D的概率是10%。一般来说,我们可以给各项附一个权重,抽取的概率正比于这个权重。那么上述集合就成了:

{A:5,B:2,C:2,D:1}

###方法一:

扩展这个集合,使每一项出现的次数与其权重正相关。在上述例子这个集合扩展成:
{A,A,A,A,A,B,B,C,C,D}
然后就可以用均匀随机算法来从中选取。

好处:选取的时间复杂度为O(1),算法简单。
坏处:空间占用极大。另外如果权重数字位数较大,例如{A:49.1 B:50.9}的时候,就会产生巨大的空间浪费。

###方法二:

计算权重总和sum,然后在1到sum之间随机选择一个数R,之后遍历整个集合,统计遍历的项的权重之和,如果大于等于R,就停止遍历,选择遇到的项。

还是以上面的集合为例,sum等于10,如果随机到1-5,则会在遍历第一个数字的时候就退出遍历。符合所选取的概率。

好处:没有额外的空间占用,算法也比较简单。
坏处:选取的时候要遍历集合,时间复杂度是O(n)。

###方法三:

可以对方法二进行优化,对项目集按照权重排序。这样遍历的时候,概率高的项可以很快遇到,减少遍历的项。
比较{A:5,B:2,C:2,D:1}和{B:2,C:2,A:5,D:1}
前者遍历步数的期望是5/10*1+2/10*2+2/10*3+1/10*4而后者是2/10*1+2/10*2+5/10*3+1/10*4。

好处:提高了平均选取速度。
坏处:需要进行排序,并且不易添加删除修改项。

# algorithm
个人理财-基金
记解决引入CXF的jar包导致异常情况的过程及所学知识

Liu Tianhe

喜欢金融,喜欢科技
31 日志
29 标签
RSS
GitHub E-Mail
© 2014 – 2022 Liu Tianhe
由 Hexo 强力驱动 v3.9.0
|
主题 – NexT.Mist v7.3.0